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Анотація. В статті запропоновані шляхи вирішення завдання структурного синтезу нейромережних 
архітектур, спираючись на нетрадиційні підходи щодо їх аналітичної формалізації та застосування нових 
операцій обробки даних. На прикладі датасету СІКАКІ0 доведено можливість підвищення точності вирішення 
завдань класифікації зображень в рамках альтернативної архітектури з розширювальною вхідною та 
звужуючою структурами навчених нейронних мереж. Результати застосування укрупнення вхідного 
зображення, що було здійснене за допомогою прошарків Кезі7іпє та Сопу2І)Тгапзро5е на вході попередньо 
навчених нейромереж, свідчать про ефективність вирішення у такий спосіб завдань класифікації на прикладі 
датасету СІЕАВІ10. Досягнута на основі нейромережі Хсерйїоп середня по 10-о0м класам точність класифікації 
зображень СІБАВІОЙ становить 97,39о. Супутній ефект попереднього масштабування зображень полягає у 
вирівнюванні точності класифікації різних класів, що дозволяє розглядати таку зміну розмірів як варіант 
аргументації даних у датасеті. Для подальшого розвитку цього підходу запроваджено тензорно-матричні 
методи формалізації опису нейронних мереж на основі проникаючого торцевого добутку матриць та його 
блокових модифікацій. На цій базі запропоновано низку нових операцій згортки та макспулінгу, а також 
поєднання на вході звужувального сегменту не тільки симетрично збільшеного зображення, а й його варіантів, 
отриманих на основі узагальненого проникаючого добутку. Мова йде про залучення зображень, розширених по 
рядках пікселів (по горизонталі) та по стовпцях (по вертикалі), а також поєднання кількох різних варіантів 
симетричних розширень зображень за принципом побудови пірамідального сегменту нейромережі РЯРМе/. 


Ключові слова: нейронна мережа, тензорно-матрична теорія, проникаючий торцевий добуток матриць. 
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Вступ 

Необхідність міграції штучного 
інтелекту у пристрої користувачів вимагає 
переходу до нових, потужніших 
обчислювальних схем, розробкою яких 
сьогодні займаються багато провідних 
компаній світу. Йдеться, наприклад, про 
використання тензорних обчислювальних 
пристроїв, більш потужної процесорної 
техніки та графічних прискорювачів, а 
також новації в архітектурі нейронних 
мереж. Разом з тим, іншим стримуючим 
чинником Є застаріла, традиційна 
математична концепція, коли для обробки 
даних використовуються звичайні 
матричні операції. Цілком очевидно, що 
розвиток | архітектурних | рішень в 
технологіях нейромереж має спиратися й 
на оновлення відповідного математичного 
апарату. Така потреба робить актуальним 
завдання структурного синтезу 
нейромережних архітектур, спираючись на 
нетрадиційні підходи щодо їх аналітичної 
формалізації з та застосування нових 
операцій обробки даних. 

Аналіз останніх досліджень |і 
публікацій 

Просування у зазначеній сфері буде 
суттєвим, якщо запровадити в бібліотеці 
програмування нейронних мереж та їх 
навчання нові підходи, у тому числі 
розвинений автором тензорно-матричний 
апарат, одним з компонентів якого є 
торцевий добуток матриць | 1-51. 

Як відомо, торцевий добуток 
зводиться до множення кожного елемента 
лівої матриці на весь рядок правої, 
відповідно до порядкового номера цього 
елемента  (1-5|. Альтернативою даної 
операції є стовпцевий добуток Хатрі-Рао, 
при якому елемент лівої матриці 
множиться на відповідний за номером 
стовпець правої. У (1-5| представлені 
властивості цих матричних операцій, їх 
комбінацій між собою та З 
кронекерівським | добутком. Особливо 
важливою є можливість переходу до 
адамарового | добутку, що спрощує 
обчислювальні операції. Серед інших 
властивостей інтерес представляє, зокрема, 
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еквівалентність даних операцій та добутку 
Кронекера щодо векторів, а також теорема, 


що зв'язує торцевий та  стовпцевий 
добутки. 

Як відомо, операція торцевого 
добутку використовується | в | рамках 


тензорного скетчу |6|, де вона дозволяє 
замінити згортку від перетворення Фур'є 
матрично-векторного добутку 
еквівалентним добутком Адамара 
відповідних Фур'є-згорток матриць. Це 
істотно знижує кількість операцій у тому 
випадку, | якщо нейронна | мережа 
трансформує вихідний простір великих 
даних у простір меншої розмірності, що, як 
правило, спостерігається у  згорткових 
нейромережах. 
Наступним узагальненням 
зазначених матричних операцій є їх 
блокові варіанти, коли відповідні 
процедури виконуються  поблочно (|З. 
Наприклад, кожна пара блоків 2-х матриць 
з однаковим  розбиттям на блоки 
множиться | за | принципом торцевого 
добутку |3). Аналогічна операція можлива 
також для блочного стовпцевого добутку 


Хатрі-Рао. 

Відносно блокових матриць 
виконується та ж властивість 
транспонування добутків і складніша 
фундаментальна властивість 
перемноження блоків матриць З 
урахуванням їх  блочно-стовпцевої та 
блочно-транспонованої структури. 

Необхідність | введення блокових 


операцій торцевого та стовпцевого (Хатрі- 
Рао) добутків зумовлена тим, що при 
диференціюванні, наприклад, стовпцевого 
добутку матриць, перехід до блокового 
варіанту дозволяє факторизувати операції 
диференціювання та знаходження 
градієнтів, що дуже важливо при описі 
процедур навчання нейронних мереж. 

Як відомо, метод зворотного спуску 
реалізується | на | основі | обчислення 
градієнта, при цьому зазначені блокові 
операції демонструють можливість 
спрощення такої процедури та її 
автоматизації. На цій основі може бути 
сформована й нижня межа Крамера-Рао 
|5), що дозволяє визначити потенційну 
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ефективність нейронних мереж в умовах 
впливу шумів. Зокрема, з даною межею 
треба порівнювати можливості штучного 
інтелекту | при вирішенні завдання 
оцінювання параметрів сигналів. Хоча у 
деяких випадках виявляється, що нейронні 
мережі дають кращу оцінку точності, ніж 
нижня межа Крамера-Рао, це питання 
потребує детального дослідження. Наразі 
подібні факти пояснюються тим, що 
нейронна | мережа враховує більше 
чинників, ніж та модель, у межах якої 
описується аналізований процес. 

У разі впливу нейронних мереж на 
розвиток відомого тензорно-матричного 
апарату, автором було запропоновано 
проникаючий торцевий добуток матриць 
/3|. Згідно з визначенням, введеним в |З3|, 
для рхе-матриці А та п-вимірного тензору 
В, розгорнутого в блокову матрицю рядків 
чи стовпців В-|В»!| (п ? 1) з рхе-блоками, 
їх проникаючий торцевий добуток має вид: 


АФВ-|лоВІІ, 
де АОВ; - добуток Адамара. 


1) 


Якщо 
отримаємо: 


тензор В є  блок-рядком, 


АшВв-|дОВУАОВІ |... АоВі і... 


Наприклад: 
а а ' ' 
А їй пе В би б і бо бо і біз б з 
П- да що з з би бо! і бо бо 213 б 


со с 


дз 232 зи бо І ба бу | 313 Бо 


АШВ- 
аби обо 1 або КЛлИЛ ар Йоз 
"дубу обу 1 ово» Фу» 1 ува або 
ауфупо 0 зо" зді дуба аа уз і ау ауо Фудз 

У цьому випадку, як показано в |3|, 
виконується  перестановочна властивість 
як щодо добутків матриць, так і щодо 


векторів, що застосовуються в нейронних 


мережах. 
Слід зазначити, що в бібліотеці 
ТепяогЕТому І71 вже реалізований 


спрощений варіант проникаючого добутку, 
який полягає в тому, що вектор множиться 
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на матрицю повністю, або матриця 
множиться на вектор |8|. У цьому випадку 
кожен елемент вектора методом добутку 
Адамара перемножується на відповідний 
стовпець матриці. Аналогічний підхід був 
розглянутий також в |9|, де описана 
модель нейронної гіпермережі на основі 
операції поелементного добутку вектора 
на матрицю, що є спрощеним варіантом 
проникаючого торцевого добутку. Однак 
вказана бібліотека Теп5огКіом не працює у 
разі перемноження матриць та блокових 
матриць, тому запропонований розвиток 
тензорно-матричної теорії | є досить 
корисним, щоб прискорити реалізацію 
обчислень під час навчання нейромереж. 

Розглянутий тензорно-матричний 
апарат дозволяє нарощувати арсенал 
методів, що використовуються при описі 
нейромереж, оскільки | проникаючий 
добуток та його блокові версії дають 
вихідні масиви о зважених даних або 
пікселів, з якими далі можна виконувати 
довільні операції. | Однак зазначені 
напрацювання потребують подальшого 
розвитку | у | поєднанні | з | новими 
архітектурними | рішеннями, чому Й 
присвячена дана стаття. 


Постановка проблеми 

Типові згорткові нейронні мережі, 
що вирішують завдання класифікації, 
мають архітектуру, яка звужується від 
входу нейромережі до її виходу зі 
зменшенням розмірності тензору даних. 
Прикладом тому є структури нейронних 
мереж ІеМеїу (10, 11|, АїехМеє П12, 131, 
УСОТ6 (14), ДепзеМег (151, МобіїеМег |16 - 
18), МАЗ5Мег (19) та ін. У той же час 
нейромережі 1)-Мег (20), генеративно- 
змагальні мережі (САМ) |21) та ін. мають у 
своєму складі й сегменти архітектури, що 
розширюється у напрямку виходу. Як 
засвідчили проведені в |22| дослідження, 
інтеграція в згорткові мережі для завдань 
класифікації фрагментів архітектури, що 
розширюється, може позитивно вплинути 
на їх точність. Разом з тим, таке 
удосконалення архітектурних рішень має 
спиратися | на | відповідний | розвиток 
тензорно-матричного апарату нейромереж. 
Це дозволить збагатити можливості 
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розробників більш широким асортиментом 
операцій з обробки даних та надасть 


додаткову варіативність нейронній 
схемотехніці. 

Мета дослідження 

Метою роботи є дослідження 
запропонованої | автором архітектури 


нейромереж для класифікації зображень на 
основі чередування ланок розширення та 


звуження архітектури | на | прикладі 
використання датасету СТЕАБКІ10, а також 
розвиток відповідного тензорно- 


матричного апарату обробки даних. 


Виклад основного матеріалу 
Метод підвищення точності класифікації 
нейромереж 

Перш ніж перейти | до опису 
отриманих результатів, слід вказати, що 
вибір для тестування нейромереж датасету 
СІБАВІО  |23| був зумовлений його 
відносною простотою. Зокрема, інший 
відомий датасет зображень СТЕАВ 100 |23| 
є дуже громіздким і потребує, наприклад, 
для виконання | 20 епох навчання 
нейромережі Хсерійоп в Сообіе Соіаб Рго- 
з використанням СР близько 6 годин 28 
хв. На основі ї ж | СІКАВІО така 
нейромережа навчається приблизно в 10 
разів швидше. 


од 


Рис. 1. Пропонована архітектура згорткової мережі 
для класифікації 


Тестування відповідних нейронних 
структур здійснювалося у фреймворку 
"Тепла АГ, що на даний момент є 
найкращим у своєму класі засобом синтезу 
та тестування нейромереж з точки зору 


досягнутого ступеня автоматизації та 
зручності використання. 

Особливістю іншої з таких 
архітектур є послідовне включення 


попередньої навченої на датасеті ПппаєеМеї 
П12, 24| нейромережі УССТІ6 1 15ТМ (рис. 
2). | При цьому для узгодження 
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розмірностей масиву даних на виході 
УССТ6 (вектор з 512 елементів) з входом 
ІЗТМ були використані два послідовно 
включені прошарки Ке5паре і 
Сопу1Ї)Ттапзро5е. Шар Ке5паре формував 
з  512-елементного вектора матрицю 
формату 16х32, яка трансформувалася далі 
за допомогою лінійки Сопу1ЮД9таперобе в 
матрицю 16х128. Параметри 15ТМ-шару 
забезпечували на виході вектор даних 256 


елементів. | Досягнута | в | результаті 
середньокласова | точність характери- 
зується величиною 88,4190. 

Цей результат можна порівняти з 
точністю, | забезпеченою | попередньо 
навченою мережею УССІб, в якості 
вихідних ланцюгів якої використані 


прошарки Депее з характерною для 1 еМеїі5 
розмірністю (120 і 34 елементи), що 
відрізняються заміною функції активації 
на | Веїл.  Стартувавши з  80,399 
середньокласової точності, така нейронна 
мережа забезпечила | на | 15-їй | епосі 
навчання точність 88,579Уо6. Аналогічна 
структура на основі Деп5еМеї201, у разі 
постійного кроку навчання  0,00001, 
призвела до точності 88,390 на 18-1й епосі. 


Рис. 2. Послідовна архітектура з використанням 
попередньо навченої нейромережі 
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Таким чином, отримані результати 
дозволяють зробити висновок, що на 
зображеннях малих розмірів майже всі 
топові | нейронні | мережі | працюють 
приблизно однаково. При цьому більш 
високу точність дають нейронні мережі, 
що забезпечують найкращі результати на 
датасеті ппаєеМеї. 

Разом з тим, винятком із цього ряду 
стала інтеграція в архітектуру рис. 1 
попередньо навченої мережі Хсерйоп. Щоб 
узгодити розмірність фотографій СІЕАВІ10 
(32х32х3) з необхідним | форматом 
зображень на вході Хсеріїоп (229х229х3 
пікселів), вихід шару нормалізації був 
заведений на додатково включений шар 
Кезідіпо | в  білінійному | режиму. У 
результаті така структура  нейронного 
класифікатора дала різкий стрибок в 
середній точності до 97,20 вже на 9-ій 
епосі. | Відповідна | матриця точності 
представлена на рис. 3. Надалі цей 
показник був збільшений до 97,39. 
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Аналогічний ефект значного 
приросту в середній точності (95,69) був 
отриманий і у разі використання замість 
Хсербоп навченої мережі ІсеріопУЗ у тій 
самій схемі включення (рис. 4). 

У якості гіпотези щодо МОЖЛИВОЇ 
причини такого зростання показників 
точності слід розглядати вплив штучного 
укрупнення вхідного зображення, що було 
здійснене за допомогою шару Кевбіліп5. 
Прояв такого ефекту на прикладі двох 
нейромереж (Хсерйоп і ГасерйопУ3) дає 
підстави вважати, що він є досить 
загальним і може бути свідченням певної 
закономірності, характерної для 
класифікаційних нейромереж. Подальші 
дослідження З перевірки цього 
припущення довели його справедливість. 
Зокрема, | у випадку  МА5МесМобіїе 
застосування | на | вході | нейромережі 
Кезідіпє до формату 224 х 224 (рис. 5) 
дозволило отримати усереднену точність 
класифікації зображень 9792. 


Чо тоє пог5е зпір писк 


Рис. 3. Матриця точності нейромережі на основі Хсеріїоп 
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Рис. 5. Схема підключення навченої нейромережі МАЗ5МеїМорбіїе 
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Цей же підхід для УМССТ6 із Кебі7іпє 
до формату 331 х 331 призвів до зростання 
точності до величини 91,19. У межах 
аналогічної | архітектури | попередньо 
навчена нейромережа ГДеп5еМе!201 
забезпечила 95,596 точності на 6-ій епосі, а 
потім на 44-ій - 97,195. При цьому Вебвігіпє 
був зроблений до формату  224х224, 
оскільки | при намаганні / використати 
формат 331х331 необхідні обчислювальні 
витрати перевищили ресурси, надані на 
той момент Сообіе Соїіаб Рго-. 

Таким чином, ефективність методу 
залежить від структури нейромережі, але 
загалом він підвищує точність. 


Слід зазначити, ї що в якості 
прошарку, що формує збільшене 
зображення на вході навченої 


нейромережі, може бути використаний 
Сопу2Гитгапзрозе (рис. 6). В основі його 


лежить застосування  кронекерівського 
добутку матриць. Зокрема, стосовно 
датасету  СІКАКІ0  (32х32х3) вхідні 


зображення можуть бути збільшені в 7 
разів, до формату (224х224х3) шляхом 
вибору наступних параметрів прошарку 
Сопу2І)Ттап5робе: кількість фільтрів - 3, 
розмір ядра згортки - 7х7, розмір кроку 
зсуву ядра - 7х7. 


іона 


Рис. 6. Архітектура мережі з прошарком Сопу2|)Ттапзрозе 
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Таке рішення у випадку тієї ж 
Оеп5еМеї201 дещо програло в точності 
застосуванню прошарку Вевзіліпе, але, при 
старті з початкових 90,4906, дозволило 
отримати точність класифікації до 9690 на 
49-1й епосі навчання. 

Аналогічні дослідження було 
проведено для Шеп5еМеі169. У випадку 
схеми із шаром Сопу2І9Ттаперовбе на 10-ій 
епосі була зафіксована точність 89,590. 
Далі з переходом від кроку навчання 0,001 
до 0,0001 точність підвищилася з 93,390 до 
93,60 на 10-ій епосі. Як і раніше, найгірше 
за точністю класифікуються класи саї, до6 
ії іга. 

Однією | з причин досягнення 
помітного приросту точності є більш чітка 
сепарація | класів | зображень, коли 
відмінності у вмісті їх ключових ознак 
багаторазово збільшуються | на площі 
аналізованого знімка. 

Крім того, суттєвий супутній ефект 
навмисного масштабування зображень 
полягає у | вирівнюванні | точності 
класифікації різних класів, оскільки на 
великих форматах наявний дисбаланс 
якості зображення вихідних знімків різних 
класів нівелюється. Зазначений ефект 
дозволяє розглядати таку зміну розмірів як 
варіант аргументації даних у датасеті. 

Разом з тим очевидно, що для 
масштабування вхідних зображень краще 
застосовувати більш складні процедури, 
які | дозволяють підвищити різкість 
збільшених зображень. Фактично на вході 
класифікуючої нейромережі | повинна 
стояти спеціальна нейромережа 
оптимального масштабування вихідного 
зображення. Як варіант, у цьому випадку 
доцільно використати САМ, яка збільшує 
зображення і поліпшує його чіткість (231. 
Крім того, для масштабування зображень 
та їх подальшої обробки доцільно 
застосувати розвинений нижче тензорно- 
матричний апарат формалізації 
функціонування нейронних мереж. 


Розвиток тензорно-матричного апарату 
нейромереж для завдань класифікації 
Завдання, винесене у заголовок цього 
розділу, може бути вирішене, спираючись 
на | вже згадану | вище концепцію 
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проникаючого торцевого добутку матриць 
(1) |3|. Щоб наочно уявити його суть у 
контексті класифікації зображень, можна 
домовитися, що матриця А, наприклад, є 
вхідним зображенням, а блок-матриця В - 
це набір вагових коефіцієнтів різних 


нейронів, наприклад, першого шару. 
Відповідно, у цьому випадку кожен 
елемент або піксель зображення 
множиться | на | ваговий | нейронний 
коефіцієнт. 

Для того, щоб формалізувати 
згорткові нейронні мережі, відповідний 
результат проникаючого добутку 


необхідно помножити на вектор одиниць 
праворуч ((А її В)хТ), або на вектор-рядок 
зліва (1Т(А ші В)), або на блоковий вектор 
одиниць праворуч за | процедурою 
блокового традиційного множення: 
(Али В) Їх 11, (2) 
де | х| - символ блокового звичайного 
добутку матриць, 1 - блок-вектор одиниць. 
Щоб отримати скаляр, необхідно 
таке множення здійснити зліва та справа: 
(А ШВУ. (3) 
При такому підході опис нейрона 
зводиться | до функції активації з 
аргументом | у вигляді проникаючого 
добутку, помноженого на вектор одиниць, 


що еквівалентно процедурі згортки, 
наприклад: 
талі (А щі Вух1- А), (3) 
або 
звенли А ш В)1--4, (4) 
де 4 - вектор (скаляр). 
Такий шюзапис дозволяє компактно 
формалізувати складну архітектуру 


нейронних мереж, що 
кількох шарів. 

Даний підхід забезпечує поєднання 
традиційної | згортки | з | попередньою 
процедурою перетворення Фур'є або 
вейвлетного перетворення. Це дозволить 
виділити додаткові ознаки, особливо якщо 
ядро згортки більше 2-х, наприклад, 4, 6 і 


складається з 
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т.д. Аналогічно, зазначена процедура може 
комбінуватися з операцією тахРооіпє. На 
даний момент відомі два її варіанти: вибір 
максимальних значень або формування 
середньозваженої суми по всьому блоку. 
Пропонується попередньо перед цим 
виконувати також перетворення Фур'є або 
вейвлет-перетворення 1 далі вибирати 
максимальний відгук. Це дозволить 
певною мірою усереднити шум у заданій 
області та якось спрогнозувати 
спектральний склад фрагмента даних. 
Аналогічне узагальнення | можливе на 
випадок 3-вимірних вхідних масивів, коли 
використовується, наприклад, ВСВ- 
матриця, або багатовимірний тензор, що 


поєднує множину даних З кількох 
відеокамер | у різних спектральних 
діапазонах. | У | цьому випадку в 


нейромережі застосовуються 3-вимірні або 
багатовимірні згортки, причому 3-вимірна 
згортка вже використовується в даний час, 
проте, комбінація її з перетворенням 
Фур'є, вейвлетами або іншими функціями 
поки не застосовувалася. 

Описаний підхід може бути 
узагальнений на різні варіанти комбінацій 
проникаючого добутку та підсумовування 
всіх | елементів | матричного блоку, 
виконання макспулінгу тощо. Можливо, 
наприклад, ввести проміжну операцію, 
коли сума формується лише по рядках 
блоку, 1 далі макспулінг застосовується в 
межах кожного з рядків, внаслідок чого 
формується векторний відгук, або ж 
аналогічна сума формується по стовпцях. 
Можливо застосувати макспулінг після 
перетворення Фур'є 1 т.д. Власне, йдеться 
про "зоопарк" згорток для нейромереж за 
аналогією | з назвою  Інтернет-сайту 
"Зоопарк нейромереж" (26). 

Формалізований 0 запис деяких з 
пропонованих | операцій | на | основі 
перетворення Фур'є наведено в табл. І. 
Аналогічні операції синтезуються на 
основі вейвлет-перетворень. В принципі, 
кожну таку операцію можна позначати 
своїм | математичним символом або 
вводити спеціальні найменування функцій, 
що словесно описують суть маніпуляцій з 
даними. 
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Таблиця 1."Зоопарк" згорток 


Позначка 
операції 


Сутність операції 


А; шу В; 


Проникаючий торцевий добуток 
(ПТД) з подальшим 
підсумовуванням усіх елементів 
отриманої матриці 


А; ім В; 


ПТД з подальшим відбором 
максимального елемента серед 
усіх елементів отриманої 
матриці (операція МахРиїї) 


А; вів В; 


ПТД з подальшим швидким 
перетворенням Фур'є (ШПФ) 
кожного з рядків отриманої 
матриці 


А; вт В; 


ПТД з подальшим ШИФ 
кожного з стовпців отриманої 
матриці 


А; іо В; 


ПТД з подальшим 
2-вимірним ШПФ кожного з 
блоків отриманої матриці 


А; ізе В; 


ПТД з подальшим 
3-вимірним ШПФ отриманої 
матриці 


А! ііке В; 


ПТД з подальшим 
К-вимірним ШПФ отриманої 
матриці 


А; ум В; 


ПТД з подальшим 
підсумовуванням елементів у 
кожному 
з рядків отриманої матриці та 
відбором максимального 
елемента у вихідному векторі 
(операція МахРи) 


А; йутм В! 


ПТД з подальшим 
підсумовуванням елементів у 
кожному стовпці отриманої 

матриці та відбором 
максимального елемента у 
вихідному вектор-рядку 

(операція МахРиї) 


А; ру В; 


ПТД з подальшим ШПФ 
кожного з рядків отриманої 
матриці та формуванням 
вихідного рядка шляхом 
міжрядкової суми елементів з 
однаковими номерами 


А! ірм В; 


ПТД з подальшим ШПФ 
кожного з рядків отриманої 
матриці та формуванням 
вихідного вектора шляхом 
відбору максимального 
елемента в отриманих рядках 
(операція МахРит) 


А; рум В; 


ПТД з подальшим ШИФ 
кожного з рядків отриманої 
матриці, формуванням 
вихідного рядка шляхом 
міжрядкової суми елементів з 
однаковими номерами та 
відбором максимального 
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елемента в отриманому рядку 
(операція МахРиші) 


ПТД з подальшим 2(3)(К)- 
вимірним ШПФ кожного з 
блоків отриманої матриці та 
відбором максимального з 
елементів (МахРиї!) 


А; йорм В 
А; зем ВІ 
А! ійікем В; 


ПТД з подальшим ШПИФ 
кожного з стовпців отриманої 
матриці та формуванням 
вихідного вектора шляхом 
міжстовпцевої суми елементів з 
однаковими номерами 


А; івту В; 


ПТД з подальшим ШПИФ 
кожного з стовпців отриманої 
матриці та подальшим 
формуванням вихідного рядка 
шляхом відбору максимального 
елемента в отриманих стовпцях 


А! йвтм В; 


ПТД з подальшим ШПИФ 
кожного з стовпців отриманої 
матриці, формуванням 
вихідного вектора шляхом 
міжстовпцевої суми елементів з 
однаковими номерами та 
відбором максимального 
елемента в отриманому векторі 
(операція МахРи!) 


А; іртум В; 


Іншим типом добутку, що розширює 
можливості роботи з нейромережами, є 
проникаючий  кронекерівський добуток, 
суть якого полягає в тому, що кожен блок 
лівої матриці множиться за принципом 
прямого добутку | на (всю матрицю 
праворуч за допомогою проникаючого 
добутку. Зокрема, для тензорів А і В, 
розгорнутих у блокові матриці з блоками 
однакової розмірності, відповідна операція 
має запис: 

А | я) В-| А ВІ- |АгоВи. (5) 


Ця процедура корисна при 
математичній формалізації обробки в 
нейромережі відеопотоку або множини 
кадрів з різних відеокамер одночасно. При 
цьому кожен кадр зображення зважується 
на свою вагову матрицю відповідно до 
множини нейронів, у тому числі кількох 
шарів. За допомогою даної операції було 
запропоновано аналітичний опис 
послідовності виконання обробки даних у 
різних прошарках моделей 1еМег5 |11| та 
АЇехМеї (13). Суттєво, що у поєднанні з 
проникаючим кронекерівським добутком 
теж можна застосовувати різні варіанти 
згорток, аналогічно наведеним в табл. І, з 
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акцентом | на | їх || 3-вимірних та 
багатовимірних версіях. 
Що стосується більш складних 


мереж, в яких мають місце не тільки 
архітектура, що звужується, але Й гілки, 
що розширюються (наприклад САМ), то в 
цьому випадку розглянутий матричний 
апарат | є недостатнім 1 може бути 
доповнений процедурою узагальненого 
проникаючого добутку. 

Суть його полягає у тому, що кожен 


блок лівої | матриці | множиться за 
принципом | проникаючого торцевого 
добутку на відповідний рядок блоків 
правої матриці. Відповідно, синтез 
архітектури нейромережі, що 
розширюється, обмежується тільки 


рядками блоків. У даний момент для 
переходу до структур, що розширюються, 
застосовується тільки прямий добуток 
матриць, тобто один елемент множиться 
на якусь вагову матрицю формату 2х2, 
3х3, 4х4 1 т.д. (див. Сопу2Р/гаперове). Хоча 
це | дозволяє | поступово | збільшити 
розмірність і перейти від малої розмірності 
на вході до збільшеної на виході нейронної 
мережі, однак у пропонованому підході 
застосовується більш гнучкий апарат. У 
його рамках можна робити розширення 
тільки по рядках або як альтернатива - по 
стовпцях блоків, що забезпечується 
узагальненим транспонованим добутком. 

У більш широкому випадку, така 
процедура може виконуватися поблоково, 
аналогічний підхід може застосовуватися 1 
до блочного узагальненого проникаючого 
добутку. Такі тензорно-матричні 
процедури дозволяють нарощувати 
структури нейромереж, застосовуючи їх 
ансамблі, кластери або конгломерати 
різної ієрархії паралельно функціонуючих 
нейросегментів, зокрема | фрактальної 
структури (271. 

У контексті розглянутої у першому 
розділі архітектури з розширенням та 
звуженням структури мережі (рис. 1) 
заслуговує на увагу поєднання на вході 
звужуваного сегменту не тільки 
симетрично збільшеного зображення, а й 


його варіантів, отриманих на основі 
узагальненого | проникаючого добутку. 
Мова йде про залучення зображень, 
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розширених по рядках пікселів (по 
горизонталі) та по стовпцях (по вертикалі) 


(рис. 7). 


Рис. 7. Архітектура згорткової мережі з поєднанням 
різних типів розширення зображень 


Крім того, можливе поєднання 
кількох різних варіантів симетричних 
розширень зображень | за | принципом 
побудови пірамідального сегменту 


нейромережі РЗРМеї (281. 

Аналогічне узагальнення архітектури 
пропонується використовувати і на основі 
проникаючого кронекерівського добутку у 
блочному варіанті реалізації, коли ця 
процедура виконується поблоково. 

На закінчення, слід зазначити, що 
запропонована різноманітність згорткових 
операцій у поєднанні з розвиненим 
тензорно-матричним апаратом надасть 
додаткові можливості розробникам щодо 
освоєння нових концепцій нейромереж та 
їх практичної реалізації. 

Важливою умовою, як вже 
зазначалося, є інтеграція запропонованих 
тензорно-матричних операцій у бібліотеки 
фреймворків проєктування та навчання 
нейронних мереж. 


Висновки 
За отриманими у роботі результатами 
можна зробити наступні висновки: 

е в нейромережах класифікації зображень 
для підвищення точності доцільно 
використовувати архітектуру з вхідною 
ланкою розширення зображень; 
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е проведені результати | застосування 
укрупнення вхідного зображення, що 
було здійснене за допомогою прошарків 
Кезігіпє та Сопу2Ю9Ттап5ро58е на вході 
попередньо навчених нейромереж, 
свідчать про ефективність вирішення у 
такий спосіб завдань класифікації на 
прикладі датасету СІБАВ 10; 

е- суттєвий супутній ефект масштабування 
зображень шляхом їх збільшення 
полягає | у | вирівнюванні точності 
класифікації різних класів, оскільки на 
великих форматах зображень наявний 
дисбаланс якості вихідних знімків 
різних класів нівелюється; зазначений 
ефект дозволяє розглядати таку зміну 
розмірів вхідних знімків як варіант 
аргументації даних у датасеті; 

- заслуговує на увагу поєднання на вході 


звужуваного сегменту нейромережі 
класифікації не тільки симетрично 
збільшеного зображення, а й його 
варіантів, отриманих на основі 


узагальненого проникаючого добутку 
матриць з розширенням зображень по 
рядках пікселів (по горизонталі) та по 
стовпцях (по вертикалі); у цьому 
контексті можливе також поєднання 
кількох різних варіантів симетричних 
розширень зображень за принципом 
побудови  пірамідального сегменту 
нейромережі РЗРМеї; 

е запропоновані в рамках розвиненого 
тензорного матричного апарату нові 


варіанти операцій згорток та 
макспулінгів У поєднанні З 
архітектурним удосконаленням 
розширюють арсенал розробників 
нейромереж та закладають підгрунтя 
для | нових напрямів відповідних 
досліджень. 
Подальші зусилля доцільно 
зосередити | на вивченні можливостей 


використання ковзної версії проникаючого 


торцевого добутку, зокрема, для 
формалізації опису механізму уваги, 
ковзної фільтрації даних по 
багатошаровому або  багатовимірному 


тензору. Зазначений ковзний режим може 
бути запроваджений і для процедури 
збільшення вибіркових фрагментів у кадрі 
зображень, наприклад, при вирішенні 
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завдання детектування та трекінгу об'єктів 
класифікації. 
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